Time Series Model 2

4. 분해 시계열
시계열은 추세요인, 계절요인, 순환요인, 불규칙요인 등으로 구성되며, 서로 복잡하게 혼합되어
하나의 시계열을 구성한다.

분해 시계열은 분석 목적에 따라 특정 요인만 분리해 분석하거나 제거하는 작업을 말한다.
(분해 시계열은 대부분 회귀분석과 사용한다.)
추세요인
인구의 증가, 기술의 변화 등과 같은 요인에 의해 장기간 일정한 방향으로 상승 또는 하락하는 경향을 보이는 요인
급격한 충격이 없는 한 지속되는 특징이 있다.
순환요인
정확한 알려진 요인이 없고, 주기가 일정하지 않은 변동을 순환요인이라고 한다.
보통 추세선을 따라 상하로 반복 우동하는 형태로 나타난다.
계절요인
일정한 주기를 가지는 상하 반복의 규칙적인 변동을 계절요인이라고 한다.
요일마다 반복되는 주기, 월별, 분기별, 계절별 등 고정적인 주기에 따라 자료의 변동이 반복되는 모든 경우가
계절요인에 포함된다. 계절요인은 매년 같은 시기에 유사한 패턴으로 나타나므로 예측하기가 상대적으로 쉬우며,
순환요인보다 주기가 짧은 것이 특징이다.
불규칙요인
위의 세 가지 요인으로 설명하지 못하는 오차에 해당하는 요인으로 어떠한 규칙성 없이 우연히 발생하는
예측 불가능한 변동이다. 불규칙요인이 많으면 신뢰성 있는 예측이 어려우며 천재지변, 질병 등과 같은
요인에 의해 발생하는 모든 변동이 불규칙요인에 포함된다.
시계열 분석 예시
R datasets 패키지의 Nile 데이터를 사용(나일강의 연간 유입량 데이터)

> library(datasets)

> library(forecast)

> auto.arima(Nile)

Series: Nile 

ARIMA(1,1,1) 


Coefficients:

         ar1      ma1

      0.2544  -0.8741

s.e.  0.1194   0.0605


sigma^2 estimated as 20177:  log likelihood=-630.63

AIC=1267.25   AICc=1267.51   BIC=1275.04

> result<-arima(Nile, order=c(1, 1, 1))


# 구축된 모형(result)로 미래 5년 예측

> pred<-forecast(result, h=5)

> pred

     Point Forecast    Lo 80     Hi 80    Lo 95    Hi 95

1971       816.1813 635.9909  996.3717 540.6039 1091.759

1972       835.5596 642.7830 1028.3363 540.7332 1130.386

1973       840.4889 643.5842 1037.3936 539.3492 1141.629

1974       841.7428 642.1115 1041.3741 536.4331 1147.053

1975       842.0617 640.0311 1044.0923 533.0826 1151.041


> plot(pred)